Was ist chi square test?

Chi-Quadrat-Test

Der Chi-Quadrat-Test ist ein statistischer Test, der verwendet wird, um festzustellen, ob ein signifikanter Unterschied zwischen den erwarteten und den beobachteten Häufigkeiten in einer oder mehreren Kategorien besteht. Er wird häufig verwendet, um die Güte der Anpassung einer theoretischen Verteilung an beobachtete Daten zu beurteilen, die Unabhängigkeit zweier Variablen zu prüfen oder die Homogenität von Populationen zu vergleichen.

Anwendungen:

  • Güte der Anpassung (Goodness-of-Fit): Untersucht, ob eine Stichprobenverteilung mit einer theoretischen Verteilung übereinstimmt. (Siehe: Güte%20der%20Anpassung)
  • Unabhängigkeitstest: Untersucht, ob zwei kategoriale Variablen unabhängig voneinander sind. (Siehe: Unabhängigkeitstest)
  • Homogenitätstest: Vergleicht die Verteilungen einer Variablen in verschiedenen Populationen. (Siehe: Homogenitätstest)

Grundlagen:

Der Chi-Quadrat-Test basiert auf der Chi-Quadrat-Statistik (χ²), die die Summe der quadrierten Differenzen zwischen den beobachteten (O) und erwarteten (E) Werten, dividiert durch die erwarteten Werte, berechnet.

Formel: χ² = Σ [(O - E)² / E]

Voraussetzungen:

  • Zufallsstichprobe: Die Daten müssen aus einer Zufallsstichprobe stammen.
  • Unabhängigkeit: Die Beobachtungen müssen unabhängig voneinander sein.
  • Erwartete Häufigkeiten: Die erwarteten Häufigkeiten in jeder Zelle müssen ausreichend groß sein (in der Regel mindestens 5). Bei kleinen Stichproben kann dies ein Problem darstellen und alternative Tests wie Fishers exakter Test sollten in Betracht gezogen werden.

Interpretation:

Ein hoher Chi-Quadrat-Wert deutet auf eine große Diskrepanz zwischen den beobachteten und erwarteten Werten hin. Dieser Wert wird dann mit einem kritischen Wert aus der Chi-Quadrat-Verteilung verglichen, der durch den Freiheitsgrad (df) und das gewählte Signifikanzniveau (α) bestimmt wird. Wenn der berechnete Chi-Quadrat-Wert den kritischen Wert übersteigt oder der p-Wert kleiner als das Signifikanzniveau (üblicherweise 0,05) ist, wird die Nullhypothese verworfen.

Freiheitsgrade (df):

Die Freiheitsgrade hängen vom spezifischen Chi-Quadrat-Test ab:

  • Güte der Anpassung: df = Anzahl der Kategorien - Anzahl der geschätzten Parameter - 1
  • Unabhängigkeitstest: df = (Anzahl der Zeilen - 1) * (Anzahl der Spalten - 1)

Nullhypothese (H0):

  • Güte der Anpassung: Die Stichprobenverteilung stimmt mit der theoretischen Verteilung überein.
  • Unabhängigkeitstest: Die beiden Variablen sind unabhängig voneinander.
  • Homogenitätstest: Die Populationen haben die gleiche Verteilung.

Alternativhypothese (H1):

Die Nullhypothese ist falsch (es gibt einen signifikanten Unterschied/Zusammenhang).

Wichtige Überlegungen:

  • Der Chi-Quadrat-Test gibt Auskunft über die Existenz eines Unterschieds, aber nicht über die Stärke oder Richtung des Zusammenhangs. Weitere statistische Maße wie Cramers V oder Phi-Koeffizient können verwendet werden, um die Stärke des Zusammenhangs zu quantifizieren.
  • Bei Verletzung der Voraussetzungen, insbesondere der erwarteten Häufigkeiten, können die Ergebnisse des Chi-Quadrat-Tests unzuverlässig sein.